\chapter{一文读懂因果图}
本章内容源自Keele et al. (2020)。因果图都是有向无环图(DAG, Directed Acyclic Graph)，如下所示，
\begin{figure}[H]
\centering
\includegraphics[scale=0.7]{DAG.pdf}
\end{figure}


\begin{definition}{一些基本概念：}{int}
 (1) 实心圆点都是都可观测变量，空心原点都是不可观测变量。

(2) 两个节点间的路径称为直接因果效应，如$ D\rightarrow Y $的路径就是直接因果效应。

(3) $ D $的父节点就是所有指向$ D $的节点集合，如集合$ P(W)=\{U,C,L\} $就是$ D $的父节点(\textbf{注意$ U $也是父节点})。$ D $的子节点就是所有从$ D $延伸出的节点，如$ Y $就是$ D $的子节点。	
\end{definition}
注意，不能有变量可以影响自己，任何其他因果效应都要独立于误差项。

通常因果图可以展示三种因果效应：
\begin{definition}{直接效应、间接效应、总效应}{int}
(1)	直接效应：如$ C $到$ Y $的直接效应就是单独的$ C $到$ Y $的箭头。\par
(2) 间接效应：$ C $到$ Y $的间接效应就是所有通过其他中间节点而指向$ Y $的直接路径。如$ C $通过$ D $有一个对$ Y $的间接效应。\par
(3) 总效应：从$ C $到$ Y $的所有因果路径。
	\end{definition}

因果图的识别依赖d分离(d-separation)的性质。两个变量在因果图中是d分离的，即统计上是独立的。两个变量是d连结(d-conneted)的，则统计上是联系的。d连结有三种场景：
\begin{itemize}
	\item 两变量有直接因果，如$ D\rightarrow Y $，它们就是d连结的。
	\item 不依赖任何条件，两变量有同一原因。如$ L $和$ Y $就有共同的原因$ U $，这不依赖任何条件，因此$ L $和$ Y $是d连结的。
	\item 两个变量，如果它们都能影响某个变量，那么基于该变量，这两个变量是d连结的。如$ C $和$ L $本身是统计独立的或d分离的，但条件于$ D $它们是d连结的。
\end{itemize}

\begin{definition}{冲突点}{int}
	冲突点就是一个被两个其他变量影响的变量。如$ D $就是个来自$ C $和$ L $的冲突点。
	\end{definition}

一旦基于该冲突点进行研究，就意味着该冲突点被激活了，反之反是。一个没有激活的冲突点，关系依赖不会传递，反之反是。因此，$ L $和$ C $即便在因果图中是独立的，一旦条件于$ D $，它们就是有相关性的。

为了识别$ D $到$ Y $的因果总效应，首先识别$ D $到$ Y $间的所有因果路径，因为这样的路径均是从$ D $出发抵达$ Y $的，这样的路径也称为\textbf{前门路径}。然后，要阻断$ D $和$ Y $间的所有混淆路径，这些路径因为都是指向$ D $的，而常被称为\textbf{后门路径}。那么，如何阻断后门路径？需要这些阻断后门路径的变量集$ W $满足后门准则。
\begin{itemize}
	\item $ W $不能包含任何冲突点，因为这会打开后门路径。
	\item $ W $中没有变量是$ D $的子节点。
\end{itemize}

一旦$ W $满足后门准则，则因果效应可以使用后门调整公式进行识别。在更多的函数形式假设下，可以使用$ Y $对$ D $回归时控制$ W $的方式识别因果效应。